Fechar

1. Identificação
Tipo de ReferênciaTese ou Dissertação (Thesis)
Sitemtc-m21c.sid.inpe.br
Código do Detentorisadg {BR SPINPE} ibi 8JMKD3MGPCW/3DT298S
Identificador8JMKD3MGP3W34R/3S3AQHH
Repositóriosid.inpe.br/mtc-m21c/2018/10.17.00.07
Última Atualização2019:01.17.15.27.28 (UTC) simone
Repositório de Metadadossid.inpe.br/mtc-m21c/2018/10.17.00.07.57
Última Atualização dos Metadados2019:01.24.16.41.40 (UTC) simone
Chave SecundáriaINPE-18119-TDI/2820
Chave de CitaçãoSantana:2018:DaScAp
TítuloA data science approach to Lattes CV data analysis
Título AlternativoUma abordagem de ciência de dados para análise de dados de Curriculum Lattes
CursoCAP-COMP-SESPG-INPE-MCTIC-GOV-BR
Ano2018
Data2018-09-20
Data de Acesso02 maio 2024
Tipo da TeseDissertação (Mestrado em Computação Aplicada)
Tipo SecundárioTDI
Número de Páginas74
Número de Arquivos1
Tamanho3271 KiB
2. Contextualização
AutorSantana, Thiago Luís Viana de
BancaVijaykumar, Nandamudi Lankalapalli (presidente)
Santos, Rafael Duarte Coelho dos (orientador)
Queiroz, Gilberto Ribeiro de
Chalhoub, Ezzat Selim
Endereço de e-Mailthiagoluis@gmail.com
UniversidadeInstituto Nacional de Pesquisas Espaciais (INPE)
CidadeSão José dos Campos
Histórico (UTC)2018-10-23 23:55:20 :: thiagoluis@gmail.com -> pubtc@inpe.br ::
2018-10-29 18:53:52 :: pubtc@inpe.br -> thiagoluis@gmail.com ::
2018-10-30 02:01:45 :: thiagoluis@gmail.com -> pubtc@inpe.br ::
2018-10-30 12:29:53 :: pubtc@inpe.br -> thiagoluis@gmail.com ::
2018-10-30 18:00:30 :: thiagoluis@gmail.com -> pubtc@inpe.br ::
2018-11-01 12:12:53 :: pubtc@inpe.br -> thiagoluis@gmail.com ::
2018-11-01 13:36:23 :: thiagoluis@gmail.com -> pubtc@inpe.br ::
2018-11-01 14:00:54 :: pubtc@inpe.br -> thiagoluis@gmail.com ::
2018-11-01 14:03:50 :: thiagoluis@gmail.com -> pubtc@inpe.br ::
2018-12-06 11:03:38 :: pubtc@inpe.br -> administrator ::
2019-01-17 15:20:58 :: administrator -> simone ::
2019-01-17 15:27:28 :: simone :: -> 2018
2019-01-17 15:28:00 :: simone -> administrator :: 2018
2019-01-17 15:28:05 :: administrator -> simone :: 2018
2019-01-17 15:28:09 :: simone -> administrator :: 2018
2019-01-19 15:28:55 :: administrator -> simone :: 2018
2019-01-24 16:41:40 :: simone -> :: 2018
3. Conteúdo e estrutura
É a matriz ou uma cópia?é a matriz
Estágio do Conteúdoconcluido
Transferível1
Palavras-Chavedata analysis
data science
Lattes Platform
bibliometrics
artificial intelligence
análise de dados
ciência de dados
Plataforma Lattes
bibliometria
inteligência artificial
ResumoA Plataforma Lattes é uma das principais bases de dados da comunidade acadêmica brasileira. Esta plataforma web foi criada pelo Conselho Nacional de Desenvolvimento Tecnológico e Científico (CNPq) e é atualizada pelos próprios pesquisadores e alunos, sendo de grande valor não só para a documentação das publicações e outros dados acadêmicos sobre os usuários e sua avaliação pela comunidade, mas também para a análise de seus dados em diferentes aplicações, por exemplo, para criar relatórios, avaliar grupos de pesquisa, programas educacionais de nível superior, instituições etc. Para realizar estas análises, os currículos devem ser baixados a priori. Todos os dados sobre o CV Lattes são públicos até certo ponto: para baixar os currículos é necessário conhecer o nome completo da pessoa de interesse ou o identificador exclusivo da plataforma Lattes. Além disso, não há ferramentas nativas na plataforma que permitam a análise específica de grupos de pesquisadores e estudantes. Assim, deve-se fazer o download de um conjunto de Curriculum Lattes e extrair os dados requeridos desse conjunto. Este trabalho pretende preencher essa lacuna através de uma ferramenta que processa e limpa o conjunto de dados Lattes CVs, permitindo seu uso por usuários com pouco conhecimento de linguagens de programação. São apresentados os relatórios que esta ferramenta gera e que estão relacionados à Análise Exploratória de Dados - como relatórios gerados com dados de Lattes CV - nuvens de palavras e gráficos que exibem relação entre pesquisadores. Também é discutida a extensão dessa ferramenta com algoritmos de classificação não supervisionados, mostrando sua integração com métodos de inteligência artificial. ABSTRACT: The Lattes Platform is the de facto database of the Brazilian academic community. This web-based platform was created by the Brazilian National Council of Technological and Scientific Development (CNPq) and is updated by the researchers and students themselves, being of great value not only to store information about publications and other academic data about the users and their evaluation by the community but also for analysis of its data in different applications, such as to create reports, to evaluate research groups, higher-level educational programs and institutions. All data on the Lattes CV is public to a certain extent: CVs can be downloaded provided one knows the full name of the person of interest or its Lattes platform unique identifier. Also, there are no native tools on the platform that allow specific analysis of groups of researchers and students; one must either browse or download a set of CVs and extract the required data from that set for posterior analysis. This work intends to fill this gap by presenting a tool that processes and cleans up a Lattes CVs data set, that was developed with focus on users with little knowledge of programming. In this work we present the reports that this tool generates and that are related to Exploratory Data Analysis such as reports generated with Lattes CV data word clouds and graphs that exhibit relationship between researchers. This work also discusses extensions of this tool capabilities with unsupervised classification algorithms, showing its integration with artificial intelligence methods.
ÁreaCOMP
Arranjourlib.net > BDMCI > CAP > A data science...
Conteúdo da Pasta docacessar
Conteúdo da Pasta source
001-24.pdf 17/01/2019 13:28 464.4 KiB 
@4primeirasPaginas.pdf 17/01/2019 13:28 161.6 KiB 
A_Data_Science_Approach_To_Lattes_CV_Data_Analysis.pdf 17/01/2019 13:27 2.7 MiB
Conteúdo da Pasta agreement
autorizacao.pdf 17/01/2019 13:27 1011.1 KiB 
4. Condições de acesso e uso
URL dos dadoshttp://urlib.net/ibi/8JMKD3MGP3W34R/3S3AQHH
URL dos dados zipadoshttp://urlib.net/zip/8JMKD3MGP3W34R/3S3AQHH
Idiomaen
Arquivo Alvopublicacao.pdf
Grupo de Usuáriosgabinete@inpe.br
pubtc@inpe.br
thiagoluis@gmail.com
Visibilidadeshown
Licença de Direitos Autoraisurlib.net/www/2012/11.12.15.10
Permissão de Leituraallow from all
Permissão de Atualizaçãonão transferida
5. Fontes relacionadas
Repositório Espelhourlib.net/www/2017/11.22.19.04.03
Unidades Imediatamente Superiores8JMKD3MGPCW/3F2PHGS
DivulgaçãoBNDEPOSITOLEGAL
Acervo Hospedeirourlib.net/www/2017/11.22.19.04
6. Notas
Campos Vaziosacademicdepartment affiliation archivingpolicy archivist callnumber contenttype copyholder creatorhistory descriptionlevel doi electronicmailaddress format group isbn issn label lineage mark nextedition notes number orcid parameterlist parentrepositories previousedition previouslowerunit progress readergroup resumeid rightsholder schedulinginformation secondarydate secondarymark session shorttitle sponsor subject tertiarymark tertiarytype url versiontype


Fechar